Telegram Group & Telegram Channel
Что такое SMOTE (англ. Synthetic Minority Oversampling Technique) и как он работает?

Это метод искусственного увеличения числа примеров в классах с меньшим числом примеров. Используется для устранения дисбаланса классов, который может повлиять на производительность модели.

Алгоритм SMOTE примерно такой:
▪️Для каждого примера из меньшего класса находятся его k ближайших соседей (в пространстве признаков).
▪️Выбирается один из этих ближайших соседей случайным образом.
▪️Между выбранным примером и его соседом генерируется синтетический пример путём интерполяции. Если говорить подробнее, это выглядит так:
Находят разность d=Xb–Xa, где Xa и Xb — векторы признаков «соседних» примеров a и b. Далее из d путём умножения каждого его элемента на случайное число в интервале (0,1) получают d^. Вектор признаков нового примера вычисляется путём сложения Xa и d^.

#машинное_обучение
#статистика



tg-me.com/ds_interview_lib/232
Create:
Last Update:

Что такое SMOTE (англ. Synthetic Minority Oversampling Technique) и как он работает?

Это метод искусственного увеличения числа примеров в классах с меньшим числом примеров. Используется для устранения дисбаланса классов, который может повлиять на производительность модели.

Алгоритм SMOTE примерно такой:
▪️Для каждого примера из меньшего класса находятся его k ближайших соседей (в пространстве признаков).
▪️Выбирается один из этих ближайших соседей случайным образом.
▪️Между выбранным примером и его соседом генерируется синтетический пример путём интерполяции. Если говорить подробнее, это выглядит так:
Находят разность d=Xb–Xa, где Xa и Xb — векторы признаков «соседних» примеров a и b. Далее из d путём умножения каждого его элемента на случайное число в интервале (0,1) получают d^. Вектор признаков нового примера вычисляется путём сложения Xa и d^.

#машинное_обучение
#статистика

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/232

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

A project of our size needs at least a few hundred million dollars per year to keep going,” Mr. Durov wrote in his public channel on Telegram late last year. “While doing that, we will remain independent and stay true to our values, redefining how a tech company should operate.

Библиотека собеса по Data Science | вопросы с собеседований from in


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA